package cn.crawler.app.crown.modules.models.constant;

import java.util.regex.Pattern;

/**
 * 皇冠爬虫用到的正则
 */
public class CrownPattern {
    /**
     * 匹配HTML标签（保留标签中的内容）
     */
//    public static final Pattern HTML_PATTERN = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);

    /**
     * 匹配HTML标签（不保留标签中的内容）
     */
    public static final Pattern HTML_PATTERN = Pattern.compile("<[\\s\\S]*?>[\\s\\S]*?</[\\s\\S]*?>", Pattern.CASE_INSENSITIVE);

    /**
     * 匹配单式、综合数据(body_var)中的总页数
     */
    public static final Pattern TOTAL_PAGE_NUM_PATTERN = Pattern.compile("t_page=(.*?);");

    /**
     * 匹配皇冠系统日期
     */
    public static final Pattern SYSTEM_DATE_PATTERN= Pattern.compile("top.today_gmt = '(.*?)';");


    /**
     * 匹配皇冠系统时分秒（目前没有用到）
     */
    public static final Pattern SYSTEM_TIME_PATTERN= Pattern.compile("top.now_gmt = '(.*?)';");


    /**
     * 匹配单式、综合数据(body_var)中g方法中的数据
     */
    public static final Pattern G_METHOD_DATA_PATTERN = Pattern.compile("g\\((.*?)\\);");


    /**
     * 皇冠新地址
     */
    public static final Pattern NEW_DOMAIN = Pattern.compile("action='(.*?)'");




}
